网络分析简介及在R中的实现
一、什么是网络分析?
从DSM-IV(Diagnosticand statistical manual of mental disorders-IV)成为心理障碍诊断和研究的参考标准之后,心理障碍的分类和量化得到了质的改变。不同于以往版本诊断系统对于病理机制可能的探讨(如DSM-III),之后的诊断系统对其他躯体疾病的诊断系统进行参考,即通过症状的特定组合来判断是否患有某种心理疾病,背后的逻辑依然是心理障碍导致了症状群或综合征的出现。
与躯体疾病的评估不同的一点是,目前的研究依然无法定位心理疾病的生理病理机制。举例来说,出现胸痛,呼吸困难,疲劳等多种症状可能是由于肿瘤导致的,医生可以通过科技手段定位肿瘤的位置。
然而对于心理疾病来说,这种操作目前尚未实现。那么心理障碍到底该如何理解和评估,目前的诊断系统似乎并没有提供完美的答案。在对心理疾病的评估和研究中,更多的是将其假设为一个共同原因(common cause)或潜变量(latent factor)来进行进一步的解释。如同其他许多心理学变量的研究,对于潜变量的假设具有其合理性(针对其不可观测的特性),但在诊断方面又有其局限性。
从2008年至今,研究者开始提出了基于网络分析对心理障碍的解释,这一观点不依赖于潜变量的存在,认为心理障碍就是相关症状所组成的网络(network),对个体心理状态的解释更多基于症状之间直接的联系。
网络的各种测量学指标构成了心理障碍的不同属性。基于这种前提,不同症状之间以及不同心理结构(网络)之间的交互变的更加扁平化,再加上网络分析其本身数据驱动的建模方式和对复杂数据极佳的可视化能力,都使得心理障碍的研究更加直观和富有探索性。
网络分析是一个仍在不断发展的统计方法。本文主要介绍目前研究中常用的一些统计指标,但需要感兴趣的读者随时进行相关内容的更新,尽可能的找到适合自己研究问题和数据的最优解。
在网络分析的结果中(图1),我们可以看到主要由节点(Node,图中圆圈指代)和节点间的联系(Edge,由图中圆圈之间的连线指代)组成。根据节点之间关系的不同,Edge分为正向(Positive,绿色)和负向(Negative,红色)两种。在临床心理学中,每个节点可以代表一个症状条目,也可以代表一个人格测量条目。
图1:Network Analysis示意图
基于整个网络中节点的关系,每个节点我们可以用四个指标来进行量化:
(1)节点强度(Strength)。表示每个节点与网络中其他节点相关的总体状况。
(2)节点期望影响(Expected influence)。由于节点强度无法很好的聚合负向的Edge,研究者对强度的指标进行了一定的调整而得到。
(3)接近中心性(Closeness)。表示网络中每个节点与其它节点间距离的(加权)总和。
(4)中介中心性(Betweenness)。表示每个节点是否会落在其它节点联系的最短路径中,例如评估一个症状是否是体系中相对核心的症状。
针对横向数据,研究者通常构建非指向性的模型(undirected model),即未对节点间的关系进行方向上(因果上)的假设,只是对节点之间的关系进行了偏相关的处理(即假设网络中其他节点保持不变),并结合以上四个数据指标评估各个节点在整个网络中的作用。非指向性模型的一大劣势就是其对变量之间因果关系的解释有限。
针对纵向数据(包括经验抽样数据),目前研究者也已经提出多个具有指向性的网络模型(directed model)的评估,但前提是要有相对足够的样本量。本文暂不对背后统计学原理进行详细的介绍,感兴趣的同学可以参考文末的推荐资源一起学习,也可以在公众号留言与我们进行更深入的探讨。
二、网络分析在R中的实现
在(临床)心理学的领域中,网络分析的实现主要靠软件R,其中必须的安装包有qgraph和bootnet,前者对所要求的网络进行图像化,后者对网络的稳定性进行评估。
安装包中包含了不同的函数旨在估计对不同类型数据的网络模型,其中Ising model(R中功能为IsingFit)适用于二元数据(binary data),GGM(Gaussian Graphical Model)适用于正态分布的数据(R中功能对应为EBICglasso)。
以下我们以儿童青少年抑郁症状量表(CDI)的结果举例来简单示意如何快速得到一个network。
样本情况,N=798,年龄12-16周岁。CDI共有27题,以下示意为d1-d27。
加载了graph,bootnet安装包之后,导入数据(Data)。导入的数据可以是原始数据,也可以是相关矩阵。
在没有任何对相关进行控制的情况下,我们先来看一下原始相关的network图。
图2:CDI中抑郁症状的原始相关关系图
继而进行偏相关处理之后得到的网络如下
图3:偏相关估计后CDI测量的抑郁症状相关图
可以看到上图中出现了大量的可能虚假的负向联系,继而应用GGM模型进行调整,纳入惩罚因子删除网络中效应值较小的连线,如图所示。
图4:GGM模型调整后的网络示意图
经过调整后,我们可以得到更为清晰合理的network示意图。继而在此基础上对上文提到的四项指标进行评估:
图5:GGMnetwork的各项指标示意图
从以上结果我们可以发现第七题(self-hate,自我憎恨)的几种中心性指标都相对较大,表明其可能是这一网络中信息传递的关键,可能对其他症状的影响有显著的作用。
以上是我们对Network Analysis所做的一个简单的呈现,具体的代码,可以私聊微信小编哟。目前研究者逐步开发出对所得网络稳定性和准确性的评估,后续的公众号会持续更新该领域的进展。
如果你认同或对心理障碍的Network视角感兴趣,我们文末也提供了一些参考文献,希望能够帮助到你。也欢迎在公众号中留言,和我们深入探讨具体的研究问题。
最后感谢数据提供者张同学的支持!
如果您觉得有用,请您分享给身边的朋友,我们需要您的支持。
本期作者:符仲芳 袁帅
热门推荐:
...
更多热门文章等你来发现
欢迎关注我们
让心理学管理学的华人研究者聚集起来,
让世界听到我们的声音,
让行路的人不再孤独,
让后来者不再无迹可寻。
一个华人心理&管理学研究者的聚集地
— — 荷兰心理统计联盟